異常值是指某些大幅度偏離正常值的資料點,來源可能是測量異常或記錄異常
由於該值容易導致模型偏離正常值的預測,因此濾除異常值通常是進行資料分析的第一步
紅點即為異常值 from [1]
高槓桿觀察值類似異常值,但通常對模型訓練有極大的正面影響,也就是有高槓桿值(high leverage)
紅點雖遠離正常值,但因其高槓桿值而不須被濾除 from [1]
然而尷尬的是,股市由於波動起伏大,容易把高槓桿觀察值辨識為異常值,
除非是差距真的十分龐大(一天價格差距2倍之類的),
否則異常值偵測可以說沒多大意義
由上所述,所以程式碼看看就好,
基本上我把程式寫完才想到上述問題,
如果我之後問/想到另外解法再改文章
沒錯,我又挖坑了